La fonction de concentration (chapitre 2) est définie sur l’intervalle [0, 1]. Elle associe à une proportion p la valeur C(p) définie par :
C(p) = S(p) / S
où S(p) est le cumul des p % valeurs observées les plus petites et S la somme de toutes les valeurs.
On note x(1), x(2), x(3), …, x(n) les observations rangées suivant les valeurs croissantes.
· L’équiconcentration signifie que les termes sont constants et égaux à leur somme S divisée par le nombre d’observations. En effet, on a :
On obtient 1/n = x(2)/S et ainsi de suite.
· La fonction C(p) est croissante et égale à 1 lorsque p = 1 (ou k = n). Cette propriété est évidente :
|
k |
|
k’ |
|
pour tout k £ k’ |
S |
x(i) £ |
S |
x(i) |
|
i = 1 |
|
i = 1 |
|
·
C(p) augmente de plus en plus vite. Considérons p = k/n
, p’ = (k+1)/n et
p’’ = (k+2)/n . On a :
C(p’) – C(p) |
= x(k+1)/S |
C(p’’) – C(p’) |
= x(k+2)/S |
Les observations sont classées suivant les valeurs croissantes. On en déduit :
C(p’) – C(p) £ C(p’’)– C(p’)
· C(p) est toujours inférieur à p, ce qui signifie que la courbe de concentration est toujours en dessous de la droite y = x.. C’est une démonstration par l’absurde un peu compliquée. Pour la simplifier, nous supposons tous les termes distincts.
Supposons C(p0) > p0 = k0/n . Si x(k0) est inférieur ou égal à S/n , on a, puisque les observations (toutes distinctes) sont classées suivant les valeurs croissantes :
pour tout i < k0 |
x(i) <S/n. |
D’où :
|
k0 |
|
C(p0) = |
S |
x(i)/S < k0/n |
|
i = 1 |
|
ce qui est impossible par hypothèse sur C(p0). Le terme x(k0) et les suivants sont donc supérieurs ou égaux à S/n .
Calculons maintenant la concentration en p = 1 (ou pour k = n) :
|
k0 |
|
n |
|
|
S |
x(i) + |
S |
x(i)] |
|
i = 1 |
|
i = k0+1 |
|
C[n/n] = C(1)= |
_________ |
_________ |
___________ |
_______ |
|
|
n |
|
|
|
|
S |
x(i) |
|
|
|
i = 1 |
|
|
> C(p0) + (n – k0)/n
> k0/n + ( n – k0)/n = 1
La dernière inégalité étant impossible, on a toujours C(p0)£ p0.